روشی کارا برای کاوش مجموعه اقلام پرتکرار در تحلیل دادههای سبد خرید
Authors
Abstract:
Discovery of hidden and valuable knowledge from large data warehouses is an important research area and has attracted the attention of many researchers in recent years. Most of Association Rule Mining (ARM) algorithms start by searching for frequent itemsets by scanning the whole database repeatedly and enumerating the occurrences of each candidate itemset. In data mining problems, the size of data is often too large to fit in main memory. However, in some cases such as records of sales of a large supermarket, the probability of a particular item to be present in a transaction is often very low. This is due to the fact that a large number of items are usually available for purchase and also the fact that a small set of items is purchased by a customer in a shopping. In this paper, we make use of these facts to propose an efficient method for mining frequent itemsets. In our approach, the database is scanned just once, and data is encoded into a compressed form and held in a proper data structure in main memory. In each iteration, the time required to measure the frequency of itemsets, is reduced further (i.e., enumerating n-dimensional candidate itemsets is much faster than (n-1)-dimensional itemsets). We evaluate the efficiency of our technique using both synthetic and real-life datasets and compare it with other ARM methods proposed in past research
similar resources
روشی کارا برای کاوش مجموعه اقلام پرتکرار در تحلیل داده های سبد خرید
کشف الگوهای پنهان و ارزشمند از درون حجم وسیعی از دادههای خام، اخیراً توجه بسیاری از محققان را به خود جلب کردهاست. اغلب روشهای کاوش قوانین تداعی در مرحله اول کار خود کلیه اقلام پرتکرار (ساده و ترکیبی) را از بین تمام اقلام موجود در دادهها جستجو میکنند که این امر نیازمند به خواندن مکرر کل دادهها از دیسک است. در مسائل دادهکاوی، حجم پایگاه دادههای تراکنش معمولاً آنقدر زیاد است که قابل بار شدن د...
full textرتبهبندی واحدهای کارا در تحلیل پوششیدادهها از طریق تضعیف واحد تحت بررسی در مجموعه امکان تولید
This paper presents a model for ranking efficient units by a new approach. In the proposed method, the idea of excluding the unit being scored from the production possibility set is changed to the idea of weakening the unit being scored. We propose a model for ranking efficient DMUs that is more efficient and less problematic than the models based on excluding the under evaluation unit.
full textارائه روشی کارا برای دستهبندی مسائل چنددستهای با رویکرد انتخاب دستهبند
سیستمهای دستهبندی شورایی، رویکردی مؤثر در یادگیری ماشین است که در آن با ترکیب نتایج چند دستهبند سعی میشود تقریب بهتری از یک دستهبند بهینه فراهم شود. در حوزه ترکیب خروجی شورای دستهبندها، رویکرد «انتخاب دستهبند» توجه کمتری را در مقایسه با رویکرد «ادغام دستهبند» به خود جلب کرده است. همچنین، اغلب روشهای موجود در این حوزه، هزینه محاسباتی بالایی دارند. در این مقاله، روشی مؤثر در دسته بندی مسائل ...
full textتحلیل گفتمانی؛ روشی برای تحلیل بازتاب انقلابها
انقلابها علاوه بر بعد ملی و سرزمینی دارای بازتابهای فراملی و جهانی هستند. نظریهپردازی در مورد این بعد از انقلابها بهطور عام و در مورد انقلاب اسلامی ایران بهطور خاص کمتر مورد توجه بوده است. این مقاله با استفاده از نظریه تحلیل گفتمان لاکلائو وموف در پی توجه به این بعد بوده و در صدد است به این سؤال پاسخ دهد که از منظر تحلیل گفتمان لاکلائو وموف، قابلیت و نحوه بازتاب یافتن یک گفتمان انقلابی ه...
full textروشی کارا برای پیش بینی ریزش مشتری
با توجه به اشباع شدن بازارها و افزایش رقابت کسب و کارها، امروزه هزینه ی جذب یک مشتری جدید به مراتب بیشتر از حفظ یک مشتری موجود است. بنابراین اهمیت مدیریت ریزش مشتری روز به روز برای کسب و کارها بیش تر می گردد. از طرفی با ظهور تکنولوژی داده کاوی و پیشرفت سریع آن، و همچنین با افزایش اطلاعات ذخیره شده در سازمان ها در ارتباط با مشتریان، کسب و کارها متمایل به استفاده از این تکنولوژی برای استخراج دانش...
15 صفحه اولMy Resources
Journal title
volume 19 issue 7
pages 65- 74
publication date 2009-01
By following a journal you will be notified via email when a new issue of this journal is published.
No Keywords
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023